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_ Архитектура надёжной п- 
_ Метогу- -СУБД 
‘на примере Тагапфоо! 


| М Моп Апдегзоп 
| || | 


Гу 
ГИ ++. чл 


/ не Нега" Яндекс 


Кто я? 


Архитектор Облака Май.ги, УК Соча ($3) 


Архитектор и продакт-менеджер Тагаптоо! 


Тагапфоо| з Яндекс (НЕ) Ниньова" 


Кто я? 


Архитектор Облака Май.ги, УК Соча ($3) 
Архитектор и продакт-менеджер Тагапфоо! 


Евангелист Тагапфоо| 


Тагапфоо| 


4 Яндекс (НЕ) Неньсаа"" 


Кто я? 


Архитектор Облака Май.ги, УК Соча ($3) 
Архитектор и продакт-менеджер Тагаптоо! 
Евангелист Тагапфоо| 


Использую Тагапфоо| более 10 лет 


Тагапфоо| 


5 Яндекс (НЕ) Неньоаа"" 


Кто я? 


Архитектор Облака Май.ги, УК Соча ($3) 
Архитектор и продакт-менеджер Тагаптоо! 
Евангелист Тагап{фоо! 
Использую Тагапфоо| более 10 лет 

Как основное хранилище 


Без «запасного» варианта рядом 


Тагапфоо| 


5 Яндекс (НЕ) Неньоаа"" 


чём мы поговорим? 


01 — Почему т-Метогу? 
02 От кеша к БД 

03 — Персистентность 
04 — Репликация 


05 — М\УСС 


чём мы поговорим? 


01 — Почему т-Метогу? 
02 — ОткешакБД 

03 — Персистентность 
04 — Репликация 

05 — М\СС 


Ссылка на слайды будет в конце 


огу СУБД? 


Зачем нужны ш-Мет 


И почему не взять «старый добрый» $01 с кешом на тер? 


Откуда взялись тш-Метогу БД? 
° Изначально БД — дисковые 


‚› И медленные 


. Память — это кеш 


Тагапфоо! 10 Яндекс (НЕ) Ненкоаа" 


Откуда взялись тш-Метогу БД? 


° Изначально БД — дисковые 

‚› И медленные 

. Память — это кеш 

. Вначале 00-х производительности стало не хватать 


. Появились первые решения для хранения в памяти 


Тагапфоо! 11 Яндекс (НЕ) Неньоаа" 


Тите$Теп: 1998 (!) 


|п-Метогу КОВМ$ 
Разработана в НР 
Куплена Огаце в 2006 


Проприетарная :( 


137. +132. +122. ТтезТеп Ве!аНопа! 


Тагапфоо| 


2.02 -0.07 -0.03 


12 Яндекс (не) Наньсаа" 


Метсаспеа: 2003 


Распределённая система кеширования в памяти 


Для Муе]оигпа! 


Простой АР! 
Шардинг на клиенте 
Автовытеснение 


Кеш, а не надёжное хранение 


Тагапфоо| 


13 Яндекс (НЕ) Неньсаа"" 


Кто ещё? 


ТитезТеп 1998 
Метсаспечд 2003 
На7е!са$+* 2008 
Тагапфоо! 2008 
Веа!5 2009 
Аегозр!Ке 2012 
Араспе |эпкКе 2015 


Тагапфоо| 


14 Яндекс (не) Нино" 


Кто ещё? 


ТтезТеп 1998 (С) 
Метсаспеа 2003 (Рет/С) 
На7е|са${ 2008 (]ама) 
Тагапфоо!| 2008 (С) 

Вед! 2009 (С) 

Аегозр!Ке 2012 (С) 
Араспе |эпКе 2015 (3ама) 


Тагапфоо| 


15 Яндекс (НЕ) Неньоаа"" 


Почему не <любимый-$О[> с кешом? 


° Обычные реляционные БД ориентированы на диск 
. Работа с диском не экономит размер 

. Работа с диском экономит /О(р$) 

. Работа с диском требует многопоточности 


 Многопоточность требует блокировок 


Тагапфоо! 16 Яндекс (НЕ) Нинкоаа" 


Что можно сделать особенного? 


е Монопольный доступ к памяти (1 поток) 
° Оптимизация под память 

. Специализированные аллокаторы 

. Ориентация на ОПР (К/\) 


Тагапфоо| 


17 Яндекс (НЕ) Неньоаа"" 


Выводы: зачем т-Метогу? 


Потому что нужна производительность! 
Большинство решений даёт сотни тысяч ОР сядра. 


Пример: 


Тагатоо| развивает до 1М ВР5$ смешанных операций 


Тагапфоо! 18 Яндекс (НЕ) Неньоаа" 


За счёт чего? 


‚ Нетчтения диска 
. Запись транзакций линейная 
. Нет необходимости кешировать 


. Идеология массового обслуживания 


Тагапфоо| 


19 Яндекс (НЕ) Неньоаа" 


Выводы: зачем т-Метогу? 


Тагапеос! 20 Яндекс (не) ниенеоаа“ 


Выводы: зачем т-Метогу? 


Тагапеос! 21 Яндекс (не) ниенгоаа“ 


Выводы: зачем т-Метогу? 


Тагапфоо! 22 Яндекс (не) НаеНьоаа"" 


Выводы: зачем т-Метогу? 


Тагапфоо! 23 Яндекс нЕ НЕНГоаа"" 


Выводы: зачем т-Метогу? 


Тагапос! 24 Яндекс (не) Неньоаа“ 


Выводы: зачем т-Метогу? 


| 
-©-- 


Тагапеос! 25 Яндекс (нг) ниенгоаа“ 


Выводы: зачем т-Метогу? 


[п- | 'п-тетогу ов | ОВ 
©@ Тагапфоо| 26 Яндекс (нь) Нньоаа"* 


Но какой ценой? 


Тагапфоо! 27 Яндекс (НЕ) Нириоаа“ 


| 


м, 


р. | ай « 
МИаЕ 44 К с0${? Емегу Е. — 


02 


От кеша к БД 


Что отличает п-Метогу БД от кеша в памяти? 


История Тагатоо! 


База данных 
Кеш со вторичными индексами 


Очередь , . 
Платформа т-тетогу вычислений 


База данных и сервер приложений 
Мемкеш на стероидах 


Резидентная БД 


Как Вед!5, но лучше Сервер приложений !ча 


Тагапфоо! 31 Яндекс (НЕ) Нирьоаа“ 


История Тагатоо! 


п-тетогу саспе 


Тагапфоо! 3> Яндекс (нк) Наеньоаа" 


История Тагатоо! 


п-тетогу рег5/5{еп{ саспе 


Тагапфоо! зз Яндекс (нк) Наеньоаа" 


История Тагапфоо! (Огапюси| 


п-тетогу рег$1$еп{ саспе 
2008 


п-тетогу рег$1${еп{ саспе мИЙ герЙсаНоп 


Тагапфоо! 34 Яндекс (НЕ) Нирьоаа“ 


История Тагапфоо! И 


п-тетогу рег$1$еп{ саспе 

2008 
п-тетогу рег$!${еп{ саспе миИ герйсайоп 
п-тетогу Кеу/ма|ие да{аБазе и 


ш-тетогу ти!{-таех да{аБазе (АС) 


Тагапфоо! з5 Яндекс (нь) НаеНЕоаа"" 


Кеу/маие фо Ми-таех 


паех 


| 


Кеу ———*+ \аце 


Тагапфоо! 36 Яндекс (нк) Наеньоаа" 


Кеу/маие фо Ми-таех 


паех паех1 паех2 


| 


Кеу ———* \аше Кеу1 а 


Кеу2 


Тагапфоо! 37 Яндекс (НЕ) Нирьоаа" 


Кеу/маие фо Ми-таех 


паех паех1 паех2 


| | 
Кеу ———>+ \ае Кеу1 а 
Кеу2 


паех1 паех2 


| 


{ Кеу1 Кеу2 Маме  \аче 


Тагапфоо| 


. 


зв Яндекс (нь) Ненеоаа“ 


История Тагапфоо! 


п-тетогу рег$1$еп{ саспе 

п-тетогу рег$1${еп{ саспе мИИ герЙсаНоп 
п-тетогу Кеу/\уа[ие дакаБазе 

ш-тетогу ти{-таех да{аБазе (АСО) 


п-тетогу ти|{-таех аь м/(И |ча ТипсИоп$ 


Тагапфоо| 


2008 


2010 


2012 


зэ Яндекс (нь) Менеоаа“ 


История Тагатоо! 


п-тетогу рег$1$еп{ саспе 

п-тетогу рег$!${еп{ саспе миИ герйсайоп 
п-тетогу Кеу/\уа[ие дакаБазе 

ш-тетогу ти{-таех да{аБазе (АСО) 
п-тетогу ти{!-таех а6 м/(И |ча ТипсИоп$ 


п-тетогу ти{!-таех аб миИ соорегай\уе гипите 


Тагапфоо| 


2008 


2010 


2012 


40 Яндекс (не) Наньсаа" 


История Тагатоо! 


п-тетогу рег$1$еп{ саспе 

п-тетогу рег$1${еп{ саспе мИИ герЙсаНоп 
п-тетогу Кеу/\уа[ие дакаБазе 

ш-тетогу ти{-таех да{аБазе (АСО) 

п-тетогу ти{!-таех а6 м/(И |ча ТипсИоп$ 
п-тетогу ти{!-таех аб миИ соорега\уе гипите 


пубга ти\-таех 46 мир $4| апд ца арр $егуег 


Тагапфоо| 


фагапоо! 


2008 
2010 


2012 


2016 


1 Яндекс (НГ) Неньсая“ 


История Тагатоо! 


п-тетогу рег$1$еп{ саспе 


п-тетогу регз1${еп{ саспе мИИ герЙсаНоп в 
п-тетогу Кеу/ма!ие дайабазе 6 
ш-тетогу ти!{-таех да{аБазе (АС) 

п-тетогу ти{!-таех а6 м/(И |ча ТипсИоп$ 2012 
п-тетогу ти{!-таех аб миИ соорегай\уе гипите 

Бубна ти\-тдех а6 м И 54| апа |ца арр $егуег * 2016 
Тагапфоо! 42 Яндекс (НЕ) Нинеоая" 


* п-тетогу сотрийпя р!аогт. М/И $О1/Мо5 ОЕ т-тетогу дафаба$е + АррЙапсе$ 


История Тагатоо! 


п-тетогу рег$15{еп{ саспе 


п-тетогу рег$1${еп{ саспе м\И герЙсайоп в 
п-тетогу Кеу/маие даабазе 6 
ш-тетогу ти!{-тдех да{абазе (АС!О) 

п-тетогу ти{!-таех а6 м/(И |ча ТипсИоп$ 2012 
п-тетогу ти{!-таех аб миИ соорегай\уе гипите 

Бубна ти\-тдех а6 м И 54| апа |ца арр $егуег * 2016 
Тагапфоо! 43 Яндекс (НЕ) Ниркоаа" 


* п-тетогу сотрийпя р!аогт. М/И $О1/Мо5 ОЕ т-тетогу дафаба$е + АррЙапсе$ 


АСО 


Абот!ску 
Соп$!$епсу 
|5о|айоп 
ОБигаб Ку 


Тагапфоо| 


Соорегай\е, 1 {Игеаа 
Соор топоро о{ {хп’5 
Мо рага|е| {хп’$ 

\Мгке Апеаа 105 


44 Яндекс (нг) Неньсая“ 


Соорегай\уе м5 Ми_КПгеаа 


ВАМ: 0.5 М - 2.5 М чтений/5 блоками по 4КЬ 


1 чтение ^ 1 мкс => 1М ВР$ 


Запись не требует блокировок 


Основной код базы — не требует потокобезопасности 


Тагапфоо! 45 Яндекс (не) НаенЕоаа"" 


Как устроен Тагатоо!? 


° 100% данных находятся в памяти 

° Доступ к данным из одного потока 

° Доступ к данным только через индекс 

. Изменения пишутся во \МгКе Авеа4 10 (\М/АЦ) 
. \\АЁреплицируется 


° Периодически сохранятся консистентный $пар$По* 


Тагапфоо! 46 Яндекс (нк) НаенЕоаа" 


е Монопольный 
доступ 


ТХ 


({гапзасНоп {геаа) 


. Монопольный 
доступ 

° Данные 
в памяти 


5расе$ 
({ае$) 


Монопольный 
доступ 
Данные 

в памяти 


. Монопольный 
доступ 

° Данные 
в памяти 


. Монопольный 
доступ 

° Данные 
в памяти 


паехе$ 


Емеп{ |оор 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 


Согои пте$ 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 


Мемогк 
{Ргеаа 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 


\ЛгКе-апеаа 


[055 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 
Изменения во 
\Мгке-Авеаад-1о8 


\Мгке-аПеаа-10в 
{ЮгеаЯ 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 
Изменения во 
\Мгке-Авеаад-1о8 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 
Изменения во 
\Мгке-Авеаад-1о8 
Консистентный 
снапшот 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 
Изменения во 
\Мгке-Авеаад-1о8 
Консистентный 
снапшот 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 
Изменения во 
\Мгке-Авеаад-1о8 
Консистентный 
снапшот 
Отдельные 
потоки для диска 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 
Изменения во 
\Мгке-Авеаад-1о8 
Консистентный 
снапшот 
Отдельные 
потоки для диска 


Откуда производительность? 


. Диск медленный 


е Системные вызовы дорогие 


Тагапфоо! сз Яндекс (не) Наньоаа" 


Откуда производительность? 


. Диск медленный 


е Системные вызовы дорогие 


Батчинг! 


Тагапфоо! 64 Яндекс (НЕ) Ненкоаа" 
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Сохранность данных в памяти 


Запись «ждёт» 
Пишем в память 
Пишем на диск 


Ждем подтверждения 


Тагапфоо! 77 Яндекс (нк) НаеНЕоаа" 


Сохранность данных в памяти 


Чтение «не ждёт» Запись «ждёт» 
Читаем из памяти Пишем в память 
Гарантированно быстро Пишем на диск 


Ждем подтверждения 


Тагапфоо! 78 Яндекс (нк) НаеНЕоаа" 


Восстановление после перезапуска 
‚ Чтение снапшота 


. Чтение х! ов 


. Построение индексов 


Тагапфоо! 79 Яндекс (НЕ) Нинкоаа" 


Восстановление после перезапуска 


.‹ Чтение снапшота 
. Чтение х! ов 


. Построение индексов 


Долгий старт 


Тагапфоо! во Яндекс (НЕ) Ненкоаа" 


03 


Обеспечение сохранности данных 


Персистентность, диск и миф про !5упс 


Для чего нужен ГРупс? 


Тагапфоо! 82 Яндекс (НЕ) Нинисаа" 


Для чего нужен ГРупс? 


Тагапфоо! вз Яндекс НЕ ННЕоаа** 


Для чего нужен ГРупс? 


упс 
«нужен» тут 


Для чего нужен ГРупс? 


Тагапеос! в5 Яндекс (не) Ниенгоаа“ 


Для чего нужен ГРупс? 


$егуег 


Тагапфоо! 86 Яндекс НЕ ННГоаа** 


Для чего нужен ГРупс? 


$егуег 


Для чего нужен ГРупс? 


Тагапфоо! 8 Яндекс НЕ ННЕоаа** 


Для чего нужен ГРупс? 


Тагапфоо! 9 Яндекс НЕ ННЕоаа** 


Для чего нужен ГРупс? 


Оатасетег 


Зегуег 


Тагапфоо! 90 Яндекс НЕ ННЕоаа** 


Датацентры горят 


тт т. 
о 


бупс защищает слишком слабо 


Не защищает от отказа диска 
Не защищает от отказа сервера 


Не защищает от отказа датацентра 


Тагапфоо| 


92 Яндекс (НЕ) Неньоаа"" 


бупс защищает слишком слабо 


Не защищает от отказа диска 
Не защищает от отказа сервера 


Не защищает от отказа датацентра 


Поэтому нужна репликация 


Тагапфоо| 


9з Яндекс (НЕ) Неньоаа"" 


Память против дисков 


Распределённая и задублированная система, не сохраняющая на 
диск, будет надёжнее одного диска* 


Ептжегризе 


Сгаае 
015К 


Вероятность одновременного отказа 
Ри = РП 


11—50 


Тагапфоо! э5 Яндекс (НЕ) Ненкоаа" 


Вероятность одновременного отказа 


Ри =Р" 
* 1—50% 
" 2—25% 
 З— 12.5% 
. 4— 6.25% 


Тагапфоо! э5 Яндекс (НЕ) Ненкоаа" 


Вероятность одновременного отказа 


Ри =Р" 
. 1— 50% 
" 2—25% 
. З— 12.5% 
4 — 6.25% 
. 10—0.1% 


Тагапфоо! 7 Яндекс (НЕ) Ненкоаа" 


Сохранность в памяти + репликация 


Читаем из памяти Пишем в память 
Пишем на диск 
Ждем подтверждения 
Реплицируем 


(Ждём подтверждения) 


Тагапфоо! в Яндекс (нь) НаенЕоаа"" 


Сохранность в памяти + репликация 


Потерять... Потерять... 
...Все данные ... «последние» данные 
КРО = «начало» КРО = «последние» 


Тагапфоо! 99 Яндекс (нь) Наеньоаа" 


Сохранность в памяти + репликация 


Потерять... Потерять... 
...Все данные ... «последние» данные 
КРО = «начало» КРО = «последние» 


* ВРО — Весоуегу Рот ОШесиуе 


Тагапеоо! 100 Яндекс (НЕ) Ниркоаа“ 


Сохранность в памяти + репликация 


Потерять... Потерять... 
...Все данные ... «последние» данные 
КРО = «начало» КРО = лаг репликации 


* ВРО — Весоуегу Рот ОШесиуе 


Тагапеоо! 101 Яндекс (НЕ) Ниркоаа“ 


04 


Репликация 


Какие виды репликации бывают и почему так много? 


Что такое репликация? 


Механизм создания точной копии 


Тагапеоо! 103 Яндекс (НЕ) Нириоаа“ 


Зачем нужна репликация? 


Резервирование: 
. Одно-нодовые системы ненадежны (диски, питание) 


. Одного ДЦ недостаточно (пожар) 


Тагапфоо! 104 Яндекс (НЕ) Нинеоая" 


Зачем нужна репликация? 


Резервирование: 

. Одно-нодовые системы ненадежны (диски, питание) 
. Одного ДЦ недостаточно (пожар) 

Доступность: 


. Время восстановления после аварии (КТО) 


Тагапфоо! 105 Яндекс (НЕ) Нинеоая" 


Зачем нужна репликация? 


Резервирование: 

. Одно-нодовые системы ненадежны (диски, питание) 
. Одного ДЦ недостаточно (пожар) 

Доступность: 

. Время восстановления после аварии (КТО) 
Производительность: 


. Железо узкое место (1 {Вгеаа, КАМ) 


Тагапфоо! 106 Яндекс (НЕ) Нингоая" 


Какая бывает репликация 


Синхронная — надежность 


Асинхронная — скорость 


Тагапфоо! 107 Яндекс (НЕ) Нинеоая" 


Синхронная и асинхронная 


Синхронная Асинхронная 

подтверждается после фиксации — подтверждается после записи на 
на реплике одну ноду 

надежная (дигаМе) можно потерять часть 
медленная «быстрая» 

выше шанс отказа отказ реплики не важен 

ВРО = 0 ВРО > 0 (= [а5) 


* ВРО — Весоуегу Рот ОШес ме 


Тагапеоо! 108 Яндекс (НЕ) Ниркоаа" 


Какая бывает репликация 


Однонаправленная —  консистентность 


Двунаправленная — доступность 


Тагапфоо! 109 Яндекс (НЕ) Нинеоая" 


Мафзег-та${ег у5 Ма\ег-герЙса 


ММ МК 
сложно использовать просто использовать 
ВТО = 0 ВТО > 0 (= РаНомег Чите) 


* ВТО — Весоуегу Ттте ОШесйуе 


Тагапеоо! 110 Яндекс (НЕ) Нирьоаа“ 


111 


Устройство репликации в Тагапфоо! 


Яндекс (но) НЕНЕоаа** 


Данные 

в памяти 
Монопольный 
доступ 
Событийный 
цикл 
Кооперативная 
многозадачность 
Отдельные 
потоки для сети 
Изменения во 
\МгКе-АВеад-105 
Консистентный 
снапшот 
Отдельные 
потоки для диска 
\МАЕ 
реплицируется 


> 
> © 


сх с 


[о Зедиепсе Митьег (1$М) 


 Монотонная последовательность 
° Определяет взаимный порядок транзакций 


. Вместе с узлом — идентификатор транзакции 


Тагапфоо! 122 Яндекс (НЕ) Нинеоая" 


Репликация в Тагаптоо! 


0:1 


[$М: 0 


Мафег 


Репликация в Тагаптоо! 


0:1 


Мазег 
№. 


Пе их | 


Тагапфоо| 


124 Яндекс (нь) ННЕоаа"" 


Репликация в Тагаптоо! 


0:1 


Мафег 


ь. 


О о: 
ПТ: 2, 


Тагапфоо| 


125 Яндекс (нь) ННЕоаа"" 


Репликация в Тагаптоо! 


0:1 


($М: 2 


Ма$ег 


М 
В м: 2, 


Тагапфоо| 


10:2 


Е$М: 0 


КерйЙса 


126 Яндекс (ные) ННЕоаа” 


Репликация в Тагаптоо! 


0:1 10:2 


($М: 2 Е$М: 0 


Мафзег КерйЙса 


ПО о Е п Е 
Пе, 5: 2.) па: 1, |5; 2, 


Тагапфоо! 127 Яндекс НЕ НаНоаа* 


Репликация в Тагаптоо! 


0:1 10:2 


Е 2 Е$М: 0 


Мазег КерйЙса 


ПО Во Е |, 
Пе 52.) па: 1, |5; 2,1 


Репликация в Тагаптоо! 


10:1 10:2 


15: 0 


Мазег КерйЙса 


{14: 1, |5п: 1, ...} | 


В О 2 в. 0: 1, 57: 2,...} 


ее, Пат, |5п. 3..1 


Репликация в Тагаптоо! 


0:1 10:2 


[$М: 3 Е$М: 0 


Мафег Мазег 


{14: 1, |5п: 1, ...} {14: 1, |5п: 1, ...} 
В ТО 2 (о: 1, 57: 2,...} 
В м па: т, |5п. 5:1 


Репликация в Тагаптоо! 


0:1 


[$М: 3 


Мафег 


{14: 1, |5п: 1, ...} 
В ТО 2 
В м 


Тагапфоо| 


т 
14: 1, [5п: 2, ... 
{1а: 1, [5п: 3, ... 
Не: 2, 5. 


131 Яндекс (нь) НнЕоаа"" 


Репликация в Тагаптоо! 


0:1 


[$М: 3 


Мафег 


о 
Е 
п п 
ПО, 5: Е 


Тагапфоо| 


т 
14: 1, [5п: 2, ... 
14: 1, [5п: 3, ... 
Не: 2, 51. Ъ 


132 Яндекс (нь) ННЕоаа"" 


Векторные часы (моск) 


Алгоритм и структура 
для упорядочивания событий 
в распределённой системе 


Тагапфоо! 133 Яндекс (НЕ) Нинеоая" 


Векторные часы (моск) 


ны 


Тагапфоо! 134 Яндекс нЕ ННГоаа** 


Векторные часы (моск) 


= 


Тагапфоо! 135 Яндекс нЕ ННГоаа*" 


Векторные часы (моск) 


— Фо ое 


Тагапфоо! 136 Яндекс нЕ ННГоаа*" 


Векторные часы (моск) 


ОК К В И 


Тагапфоо! 137 Яндекс НЕ ННГоаа** 


Векторные часы (моск) 


10= 2 


Тагапфос! 13 Яндекс (нь) Ненкоаа” 


Векторные часы (мсоск) 


10= 2 


м“ — 3} 


Тагапфос! 139 Яндекс (нь) Неньоаа" 


Векторные часы (моск) 


10= 2 


м“ — 3} 


Тагапфоо! 140 Яндекс (НЕ) Нирьоаа“ 


Векторные часы (ус оск) раю даю 


рошп\* 
10= 2 и р № _ Д 
=” Е О . 9 
2 


ьа 
# . ..° 
+ . фе 
{ \\ — и 3 } Ч Ё * 

— «) Г Минни ииииииииииииииио ции оно Ронни ни ею оф 

. . 

г] г] 

и 


{ “1” д } 
Тагапфоо! 141 Яндекс (НЕ) Нирьоаа" 


Репликация в Тагаптоо! 


› Основана на \Л\/А! 

. Использует /Соск для определения состояния 
° Мацщег-Мачег или Мазег-Керйса 

. Произвольная топология 


® Синхронная и асинхронная* 


* Может быть сконфигурирована рег $расе 


Тагапфоо! 142 Яндекс (НЕ) Нириоаа“ 


05 


М\УСС 


Ми \Мегхюп Сопсиггепсу Сопёго! 
Борьба за чистоту чтений 


Сохранность в памяти 


Чтение «не ждёт» Запись «ждёт» 
Читаем из памяти Пишем в память 


Пишем на диск 


Тагапфоо! 144 Яндекс (НЕ) Нинеоая" 


Сохранность в памяти 


Чтение «не ждёт» Запись «ждёт» 
Читаем из памяти Пишем в память 
Читаем из памяти (“Ану”) Пишем на диск (долго) 


Тагапфоо! 145 Яндекс (НЕ) Нинеоая" 


Консистентность чтений 


015К 


Тагапфоо! Яндекс не НиЕНГоаа"" 


Запись происходит в память 


\Мгкег 


КАМ 


015К 


Тагапоо! Яндекс нЕ НЕНГоаа** 


Чтение происходит из памяти 


Веадег 
\Мгкег 


КАМ 


015К 


Тагапоо! Яндекс нЕ НЕНГоаа** 


Запись на диск подтверждается 


МИГег ‚й __ т 


Й й 1 рр 
ВАМ и Ё 7/т 
—) _ РРР 


015К 


Тагапфоо! 


Яндекс (нь) НиНоаа” 


Запись на диск подтверждается 


1 1 


‚ ИВ 


Веадег В 


“м ФОР] 1 


015К 


Тагапфоо| 


Яндекс (нь) ННЕоаа"" 


Некоторые чтения — до записи в \М/АЁ 


1 


Веадег В 


\Мгкег 


‚ ИВ 


м” ОЕ] 


015К 


Тагапфоо| 


Яндекс (нь) ННЕоаа"" 


(не)консистентность чтений? 


1 1 
В 


Ми Кег и _ — ыы _—— 
ВАМ 0 __ 1 м мо 2 _ 


015К 1 


Тагапоо! Яндекс нЕ ННГоаа" 


(не)консистентность чтений? 


1 1 2 
В В 


М/гКег М! __ — Ш 
ВАМ 0 __ 1 м мо 2 м _ 


015К 1 


Тагапоо! Яндекс нЕ ННГоаа" 


Ошибка диска откатывает транзакцию 


1 1 2 
В В 


Веадег В 


Микег и _ = Ш ” 
ВАМ о И: а П.П Па: 


015К 1 Х 


Тагапфоо| 


Яндекс (нь) НнЕоаа"" 


Читатель видел «грязные» данные 


т 1 
В В 


Веадег В 


\/г ег и _ ОК Ш х 
„ ИГ и" 


015К 


р х 


Тагапфоо! 


Яндекс (нь) НинЕоаа” 


Разделить области чтения и записи 


КАМ 
КАМ 


015К 


Тагапфоо| 


Яндекс (нь) ННЕоаа"" 


Разделить области чтения и записи 


а 

—_ 
ВАМ о 
ВАМ я @_ 


015К 


Тагапоо! Яндекс нЕ НиЕНГоаа"" 


Чтение из геад-мем/ 


0 
В 


и 


ВАМ 0 м 
КАМ 0 __ и __ 


015К 


Тагап®оо|! р ы ны 


Чтение из геад-мем 


0 


я г 


ВАМ 0 “о я 
ВАМ 0 __ 1  _ 


015К . 


Тагапфоо! Яндекс (не НИЕНГоа4" 


Чтение только подтвержденного 


0 1 


я г 


В 


ВАМ о И И. п. 
ВАМ м 


015К ] 


Тагапфос! м Ан" 


Чтение только подтвержденного 


0 1 
В 


и в и в 


мм ШТО Ее 
о И М 


015К 1 


Х 


Тагапеос! Яндекс (нь) Нньсаа" 


Чтение только подтвержденного 


0 1 
В В 


“м ОЕ 
о а 


015К 1 


Тагапкоо| Яндекс (но) ны (ЕНГоаЯ ** 


Чтение только отреплицированного 


ый 


„ ВЕДРА 


О НИЯ 


015К 
Верйса 


Тагапфоо! Яндекс не НЕРГоаа"" 


Подробнее об М\УСС — завтра 


ИЗ: Яндекс трек Как работает МИСС 
в Тп-Метогу-СУБД 
25 ноября | 
(завтра) : 
14:40 — 15:30 Александр Ляпунов (Тагапкос!, УК) 


Тагапфоо! 164 Яндекс нЕ ННГоаа** 


Как устроен Тагатоо!? 


° 100% данных находятся в памяти 

. Доступ к данным из одного потока 

Доступ к данным только через индекс 

. Изменения пишутся во \М/гКе Авеа4 10 (\М/А|) 

. АСЮ обеспечивается однопоточностью и \М/АЕ 

° Периодически сохранятся консистентный 5$пар$По* 
е \\АЁреплицируется 

° Репликация гибридная (ММ, МК, 5$упс, Азупс) 


Тагапфоо! 165 Яндекс (НЕ) Нингоая" 


Спасибо за внимание! 


Бх.ус/ип1101 
Оставьте 
отзыв (®) в 


т 
Скачайте 
презентацию 
Е [) 


Бх.ис/ххх 


р опросы ( 


1 
"К 


Моп$ Апаегзоп 
©) пейгах 


Тагапфоо! 166 Яндекс (нь) НЕНГоаа"" 


